import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv(r'D:\class01\HIS\salaries_cyber.csv', delimiter=',', header=0)

# 统计行数
num_rows = df.shape[0]

# 打印行数
print("总共有 %d 行数据" % num_rows)

#region # 绘图
# # 选择第6列数据
# col6 = df.iloc[:, 5]
#
# # 绘制直方图
# plt.hist(col6, bins=50, density=True)
# plt.xlabel('第6列数据')
# plt.ylabel('频数')
# plt.title('第6列数据频数直方图')
# plt.show()
#endregion

# 检测缺失值
null_data = df.isnull().sum().sum()

if null_data == 0:
    print("CSV文件中没有缺失值")
else:
    print("CSV文件中共有 %d 个缺失值" % null_data)

#11
# for i in

# 统计类别数目
num_categories = df['column_name'].nunique()

# 打印类别数目
print("第column_name列共有 %d 种类别" % num_categories)


# 获取指定列的表头
column_name = df.columns[5]

# 打印列名
print("第6列的表头为：%s" % column_name)